#coherencia de razonamiento

ReSum: Sinergia entre Razonamiento y Resumen de LLMs con RL

Descubre cómo ReSum, un nuevo marco de RL, mejora el razonamiento de LLMs un 4% y reduce el largo de las cadenas un 18.6% mediante auto-resúmenes.